Rank in Wordlist | Frequency | Word |
---|---|---|
1982 | 122 | 1,5 |
2725 | 89 | 2,5 |
4993 | 48 | 4,5 |
5088 | 47 | 3,5 |
6038 | 39 | 5,5 |
6320 | 37 | 0,5 |
6469 | 36 | 1,2 |
7579 | 30 | 1,8 |
7826 | 29 | 1,6 |
7833 | 29 | 3,9 |
Rank in Wordlist | Frequency | Word |
---|---|---|
41946 | 4 | (фракція |
44962 | 3 | СДПУ(о |
57822 | 2 | Мова(и |
74831 | 2 | якою(ими |
75853 | 1 | 12-17°(у |
79229 | 1 | A(H3N2 |
79305 | 1 | Avalon(2006 |
101429 | 1 | України.(службова |
103140 | 1 | Шахтар»(Донецьк |
107514 | 1 | виганяють(витісняють |
Rank in Wordlist | Frequency | Word |
---|---|---|
75383 | 1 | 032)238-95-75 |
75384 | 1 | 032)258-69-68 |
118700 | 1 | к(К)аменюка |
127173 | 1 | ні)- |
144168 | 1 | українськомовні)хто |
Rank in Wordlist | Frequency | Word |
---|---|---|
42154 | 3 | 25%+1 |
53765 | 2 | 70%-му |
75629 | 1 | 100%-во |
77340 | 1 | 3%-го |
78064 | 1 | 5%-й |
Rank in Wordlist | Frequency | Word |
---|---|---|
30397 | 5 | S&P |
42395 | 3 | B&H |
54149 | 2 | P&A |
54200 | 2 | Standard&Poor’s |
79559 | 1 | Ernst&Young |
79924 | 1 | Meagher&Flom |
80257 | 1 | Standard&Poor`s |
Rank in Wordlist | Frequency | Word |
---|---|---|
78138 | 1 | 500-$1000 |
Rank in Wordlist | Frequency | Word |
---|---|---|
48643 | 3 | львів"ян |
59124 | 2 | РІА"Новости |
77753 | 1 | 4+"и |
82889 | 1 | Батьківщина"- |
84118 | 1 | ВО"Батьківщина |
84124 | 1 | ВОНИ,"каманда |
86980 | 1 | Депутат-"регіонал |
87289 | 1 | Динамо"-"Ворскла |
88147 | 1 | ЖЕП"Стимул-Сихів |
95273 | 1 | П"янзіна |
Rank in Wordlist | Frequency | Word |
---|---|---|
24052 | 7 | Poor's |
42513 | 3 | Sotheby's |
44427 | 3 | Об'єднані Арабські Емірати |
56046 | 2 | День пам'яті жертв голодоморів |
58313 | 2 | Об'єднана громадянська партія |
84524 | 1 | Веселі хлоп'ята |
89046 | 1 | Золотий м'яч |
95011 | 1 | Оператор мобільного зв'язку |
99526 | 1 | Солом'янський район |
100311 | 1 | Сєвєродонецьке об'єднання «Азот» |
Rank in Wordlist | Frequency | Word |
---|---|---|
16199 | 12 | 3+1 |
19936 | 9 | 1+1 |
42088 | 3 | 2+2 |
42154 | 3 | 25%+1 |
53426 | 2 | 27+900 |
53501 | 2 | 33+212 |
53644 | 2 | 5+2 |
75679 | 1 | 104+104 |
76160 | 1 | 152+000 |
76482 | 1 | 192+000 |
Rank in Wordlist | Frequency | Word |
---|---|---|
106714 | 1 | в*їхати |
107371 | 1 | ви*обуються |
112195 | 1 | д*яка |
Rank in Wordlist | Frequency | Word |
---|---|---|
4357 | 56 | м/с |
9926 | 22 | 1/8 |
11189 | 19 | 2012/2013 |
12274 | 17 | 1/16 |
12903 | 16 | 1/4 |
14369 | 14 | 1/2 |
16238 | 12 | ВІЛ/СНІД |
22911 | 8 | км/год |
26750 | 6 | 2/3 |
35631 | 4 | Венеції/Тревізо |
In the last subsection of this type we look for words containing other special characters: , ( ) % & $
" ' + * = / _
Depending on the language some of these characters may be allowed within words, other will not. If words with forbidden characters do not have very low frequency there might be a problem in preprocessing.
Words containing %:
select w_id-100,freq, word from words where w_id>100 and word like "%\%%" limit 10;
3.12.1 Words with Hyphens
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots